CriticGPT, le modèle d’OpenAI qui trouve les erreurs dans le code généré par GPT-4

Jeudi, OpenAI a publié un billet de blog expliquant qu'elle avait créé un nouveau modèle concernant la génération de code par IA : CriticGPT. Ici, l'idée n'est pas de générer du code via un prompt, mais de trouver les erreurs dans du code généré par GPT-4.

L'entreprise assure qu'avec ce nouveau modèle, dans 60 % des cas, les personnes qui l'utilisent ont de meilleurs résultats qu'avec seulement GPT-4.

L'idée est d'améliorer les systèmes d'apprentissage par renforcement à partir de rétroaction humaine (Reinforcement learning from human feedback, RLHF). Ils permettent à des relecteurs humains d'améliorer la précision des sorties des grands modèles de langage.

Comme à son habitude, l'entreprise publie un « papier » déposé sur son propre serveur (PDF). S'il ressemble à un article scientifique, il n'est pas déposé sur un serveur de prépublication ni encore moins publié dans une revue scientifique.

Commentaires (5)


En fait, chez OpenAI, ils admettent que ChatGPT fait de la m et tentent de corriger le tir ...
Comme on fait relire le code écrit par un stagiaire (et pas que) avant de le pousser en prod.

SebGF

Comme on fait relire le code écrit par un stagiaire (et pas que) avant de le pousser en prod.
Le temps du dev senior est précieux. Il n'a pas le temps d'essayer de comprendre ce que le larbin stagiaire a pondu.
Donc on envoie direct et c'est de la responsabilité du client de qualifier ensuite.
Si ça pète une fois le PV de recette signé, c'est plus un problème, ça devient du facturable à planifier. :non:

Bourrique

Le temps du dev senior est précieux. Il n'a pas le temps d'essayer de comprendre ce que le larbin stagiaire a pondu.
Donc on envoie direct et c'est de la responsabilité du client de qualifier ensuite.
Si ça pète une fois le PV de recette signé, c'est plus un problème, ça devient du facturable à planifier. :non:
Pas cool de divulguer la strat des centres de dev !
Comme ca vous pouvez avoir un abonnement a GPT4 + un autre abo a CriticGPT :D
Fermer